Cost-based query-adaptive clustering for multidimensional objects with spatial extents. (Groupement d'Objets Multidimensionnels Etendus avec un Modèle de Coût Adaptatif aux Requêtes)

نویسنده

  • Cristian-Augustin Saita
چکیده

We propose a cost-based query-adaptive clustering solution for multidimen-sional objects with spatial extents to speed-up execution of spatial range queries (e.g.,intersection, containment). Our work was motivated by the emergence of many SDIapplications (Selective Dissemination of Information) bringing out new real challengesfor the multidimensional data indexing. Our clustering method aims to meet severalapplication requirements such as scalability (many objects with many dimensions andwith spatial extents), search performance (high rates of spatial range queries), updateperformance (frequent object insertions and deletions), and adaptability (to object andquery distributions and to system parameters). In this context, the existing indexing so-lutions (e.g., R-trees) do not efficiently cope with most of these requirements. Our objectclustering drops many properties of classical tree-based indexing structures (tree heightbalance, balanced splits, minimum object bounding) in favor of a cost-based clusteringstrategy. The cost model takes into account the performance characteristics of the exe-cution platform and relies on both data and query distributions to improve the averageperformance of spatial range queries. Our object clustering is based on grouping spatialobjects with similar intervals (positions and extents) in a reduced subset of dimensions,namely the most selective and discriminatory ones relative to the query distribution. Thepractical relevance of our clustering approach was demonstrated by a series of experi-ments involving large collections of multidimensional spatial objects and spatial rangequeries with uniform and skewed distributions.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Traitement approximatif des requêtes flexibles avec groupement d'attributs et jointure

Les requêtes approximatives (RA) représentent une solution pertinente qui permet d’améliorer le temps de réponse aux dépens de l’exactitude. Celles-ci sont adaptées aux requêtes avec agrégats pour lesquelles la précision au dernier décimal n’est pas exigée. La contribution de ce travail est le calcul en ligne de l’agrégation pour les requêtes flexibles avec groupement d’attributs et jointure en...

متن کامل

Échantillonnage adaptatif de jeux de données déséquilibrés pour les forêts aléatoires

Introduction Les jeux de données déséquilibrés constituent un problème important de l’apprentissage supervisé. Or la plupart des modèles sont conçus pour des données équilibrées. Leur utilisation sur des données déséquilibrées conduit souvent à une mauvaise prédiction de la classe minoritaire. Pourtant, cette situation se retrouve régulièrement dans la pratique (Détection de pannes (Pazzani et ...

متن کامل

Traitement continu des requêtes dépendantes de la localisation dans les environnements intérieurs

This paper develops a data and knowledge representation of an indoor environment that takes into account user-centred contextual dimensions and mobile data management issues. We introduce a hierarchical, context-dependent, and feature-based indoor spatial data model in which location information is represented at different levels of abstraction. A query language supporting continuous location-d...

متن کامل

Optimisation des approximations de probabilité des requêtes en XML probabiliste

XML probabiliste est un modèle probabiliste pour les bases de données incertaines semi-structurées, avec des applications telles que l’intégration incertaine de données, l’extraction d’informations ou le contrôle probabiliste de versions. Nous explorons dans ce travail une solution efficace pour l’évaluation des requêtes tree-pattern avec jointures sur ces documents, ou, plus précisément, pour ...

متن کامل

Modèle de préférences contextuelles pour les analyses OLAP

Les systèmes OLAP (On-Line Analytical Processing) permettent l’analyse de grands volumes de données issues des systèmes transactionnels de l’entreprise. Ils reposent le plus souvent sur des bases de données multidimensionnelles (BDM) qui organisent les données en sujets d’analyse appelés faits, et axes d’analyse appelés dimensions. L’analyse en ligne OLAP consiste à explorer intuitivement les B...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006